17 research outputs found

    Um Modelo semi-automático para a construção e manutenção de ontologias a partir de bases de documentos não estruturados

    Get PDF
    Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Engenharia e Gestão do Conhecimento, Florianópolis, 2010Considerando-se que grande parte do conhecimento de uma organização ou daquele disponível na web são documentos textuais, estes se tornam uma importante fonte para modelos de manutenção de ontologias. Nota-se ainda que o uso das ontologias como meio de representar formalmente o conhecimento vem crescendo em importância no desenvolvimento de sistemas baseados em conhecimento. Nesse sentido, o presente trabalho utiliza técnicas de extração de informação e agrupamento de documentos para explicitar entidades que podem tornar-se instâncias de uma ontologia de domínio. Para as fases de validação e classificação das instâncias encontradas, é proposta a utilização de bases de conhecimento colaborativas, contando-se com o auxílio de especialistas de domínio, o que se caracteriza como um processo semiautomático. Visando demonstrar a viabilidade do modelo proposto, foi desenvolvido um protótipo para suportar as fases de extração, validação e classificação dos resultados. O protótipo foi aplicado em um estudo de caso utilizando résumés de alguns pesquisadores, assim como em um estudo experimental mais amplo com résumés de pesquisadores da área de Biotecnologia. Por fim, foram analisados seis trabalhos similares com foco na aprendizagem e na população das ontologias com vistas a propiciar uma avaliação comparativa ante o modelo proposto. De modo geral, verificou-se que o modelo proposto auxilia tanto na construção inicial de uma ontologia de domínio, levando em consideração coleções de documentos (bases de dados não estruturadas), quanto no processo de manutenção de ontologias

    Turning Text into Research Networks: Information Retrieval and Computational Ontologies in the Creation of Scientific Databases

    Get PDF
    BACKGROUND: Web-based, free-text documents on science and technology have been increasing growing on the web. However, most of these documents are not immediately processable by computers slowing down the acquisition of useful information. Computational ontologies might represent a possible solution by enabling semantically machine readable data sets. But, the process of ontology creation, instantiation and maintenance is still based on manual methodologies and thus time and cost intensive. METHOD: We focused on a large corpus containing information on researchers, research fields, and institutions. We based our strategy on traditional entity recognition, social computing and correlation. We devised a semi automatic approach for the recognition, correlation and extraction of named entities and relations from textual documents which are then used to create, instantiate, and maintain an ontology. RESULTS: We present a prototype demonstrating the applicability of the proposed strategy, along with a case study describing how direct and indirect relations can be extracted from academic and professional activities registered in a database of curriculum vitae in free-text format. We present evidence that this system can identify entities to assist in the process of knowledge extraction and representation to support ontology maintenance. We also demonstrate the extraction of relationships among ontology classes and their instances. CONCLUSION: We have demonstrated that our system can be used for the conversion of research information in free text format into database with a semantic structure. Future studies should test this system using the growing number of free-text information available at the institutional and national levels

    The Impacts of the Fourth Industrial Revolution on Smart and Sustainable Cities

    Get PDF
    This article aims to analyze the impacts of the Fourth Industrial Revolution on the implementation of smart sustainable cities. For this purpose, a data mining process was conducted to analyze the terms that had a higher incidence in the literature in order to classify them by relevance and identify their interdependencies in the concepts of sustainable cities and smart cities. As a result, we highlight that the Fourth Industrial Revolution will have implications on several factors that are deeply connected to the success of cities in becoming sustainable: job creation, industries, innovation, environmental preservation, community involvement, and accessibility. In this context, policymakers will have opportunities and challenges that must be faced. Big data, the IoT, augmented reality, and simulations can have positive and negative externalities. Positive externalities include new information that could be mined, analyzed, and used for identifying previously unseen problems, the provision of new industrial innovations that can make economies thrive, helping promote inclusion for disabled people, as well as helping society to foresee problems and hence adapt to them in a timely manner

    Um modelo baseado em casos e ontologia para apoio à tarefa intensiva em conhecimento de classificação com foco na análise de sentimentos

    Get PDF
    Tese (doutorado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-graduação em Engenharia e Gestão do Conhecimento, Florianópolis, 2015O uso de informações externas às organizações, presentes nas redes sociais, pode auxiliar no processo de compra de um produto por parte de um cliente a partir da leitura de revisões ou de blogs especializados. A classificação de texto, mais precisamente, a análise de sentimento, auxilia na definição da imagem de um produto ou na identificação do sentimento de uma sentença como positiva ou negativa. Neste trabalho propõe-se um modelo que combina ontologia de domínio com técnicas de processamento de linguagem natural para a identificação do sentimento agregado a uma determinada sentença, buscando apresentar uma explicação para tal polarização. Utiliza-se ainda o raciocínio baseado em casos para que seja possível aprender com os raciocínios (polarizações) passados, visando reutilizá-los em novas classificações. Também foram elaboradas etapas para o tratamento de negação, para a adequação do léxico de sentimento para um domínio e para a adaptação da classificação de termos ambíguos baseados em classificações passadas. Foram desenvolvidos testes em dois domínios distintos, câmeras digitais e filmes, para justificar a evolução do modelo até se chegar à proposta final. Pôde-se observar que a acurácia obtida pelo modelo é superior à obtida por abordagens estatísticas tradicionais. Esses resultados demonstram que o modelo da tese contribui para a área de análise de sentimento, tanto no nível da acurácia quanto pela possibilidade de apresentar o caminho percorrido para chegar a determinada classificação.<br>Abstract : The use of information outside organizations available in social networks such as reviews or specialized blogs can assist customers in their decisions. The text classification, more precisely sentiment analysis, assists in defining the image of a product or identifying the sense of a sentence as positive or negative. This work intends to combine domain ontology with natural language processing techniques to identify the sentiment behind judgments aiming to provide an explanation for such polarization. Also, it intends to use the Case-Based Reasoning strategy in order to learn from past reasonings (polarizations) so they can be used in new polarizations. Some steps have been developed for treatment of negation, adequacy of sentiment lexicon for a domain and adaptation of ambiguous terms classification based on past ratings. Tests were developed in two distinct areas, digital cameras and movies, to justify the model evolution until its final proposal. It was observed that the accuracy obtained by the proposed model overcomes standard statisticals approaches. These results demonstrate that the thesis model contributes to the sentiment analysis area, both as a solution that provides high levels of accuracy, as well as the possibility to present the track to achieve a particular classification

    Specific network graphic for the computer science instance.

    No full text
    <p>Specific network graphic for the computer science instance.</p

    Comparison of our method with previous works.

    No full text
    <p>Comparison of our method with previous works.</p

    Relations between instances “denilson” and “alexandre”.

    No full text
    <p>Relations between instances “denilson” and “alexandre”.</p

    Expanded network graphic for the biotechnology instance.

    No full text
    <p>Expanded network graphic for the biotechnology instance.</p
    corecore